在 Ubuntu 20.04 里装设 ibus |
您所在的位置:网站首页 › rime 日语方案 › 在 Ubuntu 20.04 里装设 ibus |
Ping-Wu 写了: ↑2020-07-06 6:23
ibus-rime 有 60个干支供选择。
我们应该可以把 rime 里的预设词库(繁体中文)换掉。
因为档案太大了,不好编辑。可以用……的方式补到前面 dict.yaml 档案的屁股后面,即可。
我的“单手笔顺输入法”核心词库的“数学算术”分类里,也包含有 60 个干支,还有 64 卦呢。
需要注意的是,在Windows系统下Rime对词库文件的大小有限制,太大无法生效,最好不要超过85M(或100M),太大的词库文件需要拆分成几个子词库文件。Linux系统下Rime词库文件的大小没有限制,一个就行。 关于港台的词库,繁简转换是小事,更大的问题是:两岸三地很多词汇的写法不一样,例如:网络——網路,奔驰车——平治車,这不是繁简转换能解决的。我目前收集有几个G的大陆网友词库,几千万条,但有很多词汇是重复的、生僻的、超长的、胡乱自造的、有错别字的、恶意骂人的,淫秽的,必须想办法剔除这些词语。 在我把“单手笔顺输入法”的单字码表 2.0 版修正完成后,我就会处理这些词库。目前的想法是(我能做到的):用Python脚本剔除重复项,筛选出2~7字的词汇,尽量(根据已有的列表)排除一部分错别字词汇和不良词汇,剩下的只能靠人工浏览挑选/剔除了,工作量不是一般的大。——之前曾想过借用sogou,baidu、QQ输入法内置的“核心词库”,但都是加密防止被别入窃用的。好不容易找到一个旧版破解了的,结果打开一看,里面尽是XX汽车、XX房产、XX游戏的名称,常用的词语反而少之又少,于是放弃。 如果能找到类似《现代汉语词典》的电子版词库(可复制粘贴),那就规范、方便、省事多了。 百度文库有网友上传的《现代汉语常用词表(草案)》和《现代汉语常用词汇表》,但需要VIP会员才能下载。 (还好,我可以一页一页慢慢复制……两本书才一二百页而已嘛。) 影印版的PDF文件 http://www.moe.gov.cn/ewebeditor/upload ... 920115.pdf 之前也是,我想找“一二三级汉字”即《通用规范汉字表》,于是去政府网站: 国家语言文字工作委员会 http://www.moe.gov.cn/jyb_sy/China_Language/ ——语言文字信息管理司 http://www.moe.gov.cn/s78/A19/ ——语言文字规范标准——《通用规范汉字表》.pdf http://www.moe.gov.cn/s78/A19/yxs_left/ ... 86002.html 国务院关于公布《通用规范汉字表》的通知——国发〔2013〕23 号 http://www.gov.cn/zhengce/content/2013- ... t_1289.htm 但下载的是影印版的PDF文件,而且编排方式不利于提取所有单字。 然后“百度文库”里倒是有网友提取了单字的doc文件,但是需要“2下载券”! 晕~~~“2下载券”值几分钱?能拉来几个(被迫加入的)新用户? 这么积阴德的事,反而自己给自己设置障碍? 积阴德有什么用? ——汉语拼音发明人周有光,没有发大财,他活了112岁! ——邵逸夫是有钱的大老板,生活条件没得说,在全国各地盖了那么多教学楼,也积了不少阴德,活了107岁,即使如此,仍比周有光少活了5年。 没发财活那么久有什么用? ——周有光是2017年去世的,如果他只活到100岁就没见过智能手机;如果他只活到90岁就没上过互联网;如果他只活到80岁就没碰过电脑;如果他只活到70岁……人生70古来稀……既发不了大财,也活不到70岁,那岂不是更亏?积阴德比发大财容易多了。 话说回头,诸如: 规范标准的中文汉语字体——应该公布免费电子版,让公众知晓八万汉字每一个的正确写法。有很多“非艺术化”字体里的字,并没有按国标GB13000.1笔画规范来书写,写成了另一个形状。包括谷歌的开源字体也有很多错误。 规范标准的中文汉语词库——应该公布免费电子版,并责令商业输入法在网友错误输入时自动更正。拼音输入法里各种谐音带错别字的词汇,数不胜数。四字词语错两字的都有,然后一传十,十传百。唉。 像这类“电子版基础文化”的工作,应该由“国家语言文字工作委员会”组织专家来尽快完成才对。 如果有人大代表看到本帖,就提议一下吧。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |